31 research outputs found

    A magyar beszédben előforduló mássalhangzó-kapcsolódások rezgésképének és akusztikai szerkezetének kutatása, rendszerezett leírása = Research of the acoustic structure of Hungarian consonant clusters in speech

    Get PDF
    A magyar hangtani kutatásokból hiányzik a mássalhangzó kapcsolódások akusztikai szerkezetének bemutatása. A kutatással elérni kívánt cél: ismerjük meg a mássalhangzó kapcsolódások akusztikai szerkezetét, tudjuk meg, hogy mely akusztikai paraméterek a legfontosabbak a mássalhangzó kapcsolódásokban a folyamatos beszéd korrekt felépítése szempontjából. Az akusztikai jelből visszakövetkeztethetünk az artikulációra. Itt arra vagyunk kíváncsiak, hogy milyenek a mozgássorozati elemek a mássalhangzó kapcsolódásban, mely mozgáselemek egyszerűsödnek, illetve melyek nem változnak a mássalhangzó hagyományos, például intervokális helyzetű képzéséhez viszonyítva. A vizsgálatokat két-, három-, négy- és ötelemű mássalhangzó kapcsolatokra végeztük. A várható eredmény: összefoglaló leírás a magyar mássalhangzó kapcsolódások akusztikai szerkezetéről. Az eredményeket oktatási anyag formájában az Interneten is hozzáférhetővé tesszük. | There are no data about the acoustic structure of consonant clusters in Hungarian speech. The aim of this research is to get more knowledge about the acoustic specialities of these speech building elements and to determine the invariant acoustic parameters. It is also possible to derive the articulation movements from the acoustic parameters, so the articulation of these consonant clusters can be studied as well. The following clusters are investigated: CC, CCC, CCCC, CCCCC. The result is a study about the Hungarian consonant clusters in speech. The book is to be published in Hungarian in 2007. Besides this the results can be studied ont he Internet at the home page: http://fonetika.nytud.hu/cccc . This interactive speech database serves as a good tool for education and research as well

    Predicting Hungarian sound durations for continuous speech

    Get PDF
    Direct measurements show that a number of factors influence the final value of sound durations in continuous speech. On the segmental level it is mainly the articulatory movements that determine  important influence factors, while on the suprasegmental level accent, syllabic stress, within-word position, the preceding and following syllables and finallyutterance position may have an influence on final sound durations. So the problem of how to predict  sound durations can be described with a multivariable function in which the effect of the variables cannot be easily defined with good accuracy. It is difficult to separate the effects of certain functions, i.e., it is difficult to model this function, making direct measurements on the speech signal. A model has been constructed and realized in which three well-defined levels are working separately. In the first one (this is the segmental level) the separation of the effect of articulation from other factors is solved. The second and third levels relate to the suprasegmental level of speech

    The most important prosodic patterns of Hungarian

    Get PDF
    Prosody is a general term for the following features in speech: pitch and intonation, stress, articulation rate, sound intensity and time structure (rhythm and pauses). During verbal communication various prosodic forms contribute to the expression of the content of the message (the information carried by the text, emotional expression, to imitate a situation etc.). So, prosody can be represented as a multivariable function in which the number of variables is rather high. Therefore it is difficult to describe the complex process for all situations, meanings, and emotions. In this paper we try to give a phonetic level characterization  of pitch and intonation structure and also the function of intensity in time of the main Hungarian sentence types (using a  unified description). The manner of description is new concerning Hungarian. It is based on a unified relative  scale in which not physical values but relative distances in pitch values and intensity  are used to characterize the melody forms and the intensity levels. This description allows for the representation of these two prosodic elements independently of the personal features (mean F0 value, the range of the F0 of the speaker, etc.). The representation makes it possible to express the crossfunctions among the melody forms of different expressions. This means that complete prosodic patterns can be predicted for any text without an acoustic analysis

    Fonetikai algoritmus a hanghatárok gépi meghatározásának javítására nagyméretű beszédadatbázisokban

    Get PDF
    A beszédtechnológiai kutatásokhoz és gyakorlati alkalmazásokhoz egyre nagyobb méretű beszédadatbázisokat terveznek. Ezek egyik fajtája, amikor előre meghatározott szöveg felolvasásával hozzák létre a több órányi beszédanyagot. Ilyen adatbázis például a BME TMIT időjárás jelentéseket tartalmazó beszédkorpusza, amelyik 5400 mondatot tartalmaz. Ahhoz, hogy gépi módszerekkel lehessen ezt a hanganyagot a későbbiekben feldolgozni (szavakat, hangkapcsolatokat keresni stb.), a szöveget át kell írni hangszintű szimbólumsorozattá, majd jelölni kell a hanghullámon a hangokat, azok határát, a szavak kezdetét, a szüneteket, valamint szinkronba kell hozni a szöveget a hangzó formával automatikus gépi felismerés segítéségével. Az így jelölt hangok és hanghatárok csak mintegy 95%-os pontossággal adnak kellően helyes eredményt. Ez azonban nem elegendő a jó minőségű, korpusz alapú beszédszintézishez. Ebben a tanulmányban egy olyan utófeldolgozó algoritmust ismertetünk, amelyikkel növelni lehet a pontosságot, ezzel a szintézis minőségét

    Interaktív formánsérték-módosító fejlesztése

    Get PDF
    A cikkben bemutatjuk egy webalapú interaktív formánsértékmódosító program felépítését és használatát. Az alkalmazás kötött szerkezetben várja a kiinduló formánsértékeket, melyeket egy Flash-ben készült program segítségével tudunk kényelmesen módosítani, azaz hozzáigazítani a hangszínképhez. A kiindulási és módosított értékeket is MySQL adatbázisban tároljuk, melyek fel- és letöltésrl külön funkció gondoskodik. A formánsmódosítás során használt hangszínkép megjelenítéséhez a WAV formátumú hangfájlok feltöltése is szükséges. A fejlesztést a magyar formánsadatbázis készítése és továbbfejlesztése ihlette

    Magyar hangsúly-adatbázis az interneten kutatáshoz és oktatáshoz

    Get PDF
    Hangsúlyadatbázis eddig nem készült magyar nyelvre. Beszédtechnológiai kutatásokban és az oktatásban is nagy igény lenne egy referenciaként használható, helyes hangsúlycímkéket tartalmazó mondatgyjteményre. Fejlesztésünkkel ezt a hiányt kívántuk pótolni. A webes lekérdezfelülettel rendelkez hangsúlyadatbázisunk 1869 kijelent mondatot tartalmaz, amelyekben minden szó hangsúlypozícióját megjelöltük. A honlapon számos szempont alapján kereshetünk és a találati lista is több formában (szöveges, kép és hang) jeleníthet meg. A vizsgált magyar mondatok hangsúlymintázatainak gyakorisága is lekérdezhet. A honlap a http://magyarbeszed.tmit.bme.hu/hangsuly címen érhet el

    Kísérlet automatizált szövegelemzési módszerek kialakítására a szóhangsúlyok meghatározásához

    Get PDF
    Az automatikus szövegelemzés bonyolult kérdésköréből egy résztéma vizsgálatát tztük ki célul, nevezetesen a hangsúly-kategóriák szavankénti kijelölését meghatározott mondatokban. Az eredményeket a gépi beszédszintézis prozódiai támogatáshoz tervezzük felhasználni. A hangsúly-kategóriákat úgynevezett címkékkel jelöljük a szó előtt a szövegben. A célkitűzést két irányból közelítjük: A klasszikus módszernél a címkéket nyelvészeti mondatelemzés eredményéből nyerjük. A másik eljárás lényege nem nyelvészeti központú, hanem egyfajta egyszer felszíni szövegelemzés, melyben nem használunk nyelvészeti módszereket, csupán szólistákat, táblázatokat, egyszer szabályokat. Mindkét elemzési formánál alapkövetelmény az algoritmizálhatóság. Az elemzésekhez ugyanazokat a hangsúly-kategóriákat használjuk, így mód nyílik arra, hogy közvetlenül összehasonlíthassuk a nyelvészeti elemzés eredményét a nem nyelvészeti központú eljárásból kapott hangsúly jelölésekkel. Rávilágítunk mindkét elemzésnél, hogy mely problémák miatt nem kaphatunk teljes érték eredményt sok esetben

    REALIS 1.1

    Get PDF
    A laptopos bemutatásra szánt eALIS1.1 program elssorban nyelvészek (mint „bels felhasználók”) számára hivatott eszköztárat adni olyan nyelvfragmentumok építésére, amelyek jól ragadják meg a természetes nyelvek sajátosságait, elssorban a kompozicionális jelentésösszegzdést. A definiálható jelentések olyan pragmatikai-szemantikai leírások, amelyek megfelelnek a (reprezentacionalista dinamikus diskurzusszemantikák családjába tartozó) eALIS releváns definícióinak. A felépített nyelvet alkalmazókat küls felhasználóként határozhatjuk meg. Lényegében egy sajátosan megsokszorozott adatbázist kapnak, ami a való világ modellje mellett annak alternatíváit is felkínálja. A eALIS alapállása szerint ezek a formális szemantikából ismerhet „lehetséges világok” mindig odaköthetek a világmodellben jelen lév humán ágensekhez mint azok (tév-) hiedelmei, vágyai, szándékai, álmai. A küls felhasználó a program használata során (lépésrl lépésre) lexikai egységeket kap választásra, ezekbl mondatokat építhet, a felépített mondatoknak pedig megkapja az igazságértékelését egy általa kiválasztott vagy feltöltött világmodell alapján. Az igazságértékelést olyan „konstruktivista” módon kib- vítve értjük, hogy a program az „igaz” válaszon túl megadja mindazt az információt, ami alátámasztja e választ. Nemcsak a nyelvleírás „próbára tételét” szolgálhatja tehát a program, hanem adatgyjtésre és -rendszerezésre is használható
    corecore